Выравнивание как отражение эволюции. JalView

Освоение JalView

Для выполнения упражнений из задания 1 я выбрала 6 последовательностей белков из семейства HSP70. Более полную информацию о них вы можете получить из файла Exel. Выравнивания (Если вы хотите узнать больше о выравниваниях последовательностей, вам может помочь статья из Википедии) были построены с помощью программы JalView, которую можно скачать здесь.
Проект JalView, содержащий выравнивания из практикума 10, можно скачать тут.
Рис.1 Полное выравнивание последовательностей в раскраске ClustalX.(100%)
Ссылка на fasta-файл.



Оценка консервативных позиций

С помощью функции infoalign я рассчитала процент и число консервативных позиций. Информация об абсолютно консервативных позициях, абсолютно функционально консервативных позициях, позициях с гэпами, а также о позициях, консервативных на 70% или более, представлена в таблице "Консервативность белков". Процентные соотношения были рассчитаны по формуле:
(количество позиций)/(длина выравнивания)*100% , где длина выравнивания равна 728.
Консервативность белков
Позиции Количество позиций Процентное соотношение
Абсолютно консервативные 160 21,98%
Абсолютно функционально консервативные 273 37,50%
С гэпами 141 19,37%
Консервативные белее чем на 70% 248 34,07%

Рис.2 Примеры разных типов консервативности в раскраске ClustalX.(80%)

Обозначения, принятые для добавленной мной позиции ConsPos:
~ позиции, консервативные на 80% или более (C)
~ абсолютно функционально консервативные позиции (F)
~ позиций с гэпами (G)

При анализе позиций, отмеченных литерой F, легко заметить, что все аминокислотные остатки принадлежат одной функциональной группе. ( V,A,I - 33 позиция, I,V,L - 34 позиция, I,V - 47 и 55 позиции - это алифатические а.к.о.(неполярные, отличны количеством и расположением атомов углерода) S,T - 41 позиция - это нейтральные а.к.о.(полярны, содержат -ОН группу и отличаются на одну метильную группу))

Эволюция последовательности белка B8H6Q1 (DNAK_PSECP)

Для проведения эксперимента, позволяющего имитировать эволюционные процессы в последовательности, я выбрала участок (120 а.к.о) последовательности белка-шаперона (белка, способствующего укладке других белков). В ходе исследования я провела семь раундов мутаций с помощью функции msbar из пакета EMBOSS. Их результат представлен на рис.3.Кроме того, вы можете загрузить конечный Fasta-файл, содержащий участок последовательности на всех этапах эволюции.
Рис.3 Последовательности участка шаперона на всех этапах эволюции

Полученные послодовательности были выравненны с помощью встроенной программы. Результат выравнивания можно увидеть на рис.4.
Рис.4 Автоматически построенное выравнивание
Ссылка на fasta-файл.



В таблице "Комментарии к выравниваниям, построенным программой" описаны первые десять мутаций последовательности. В первом столбце таблицы указаны момент возникновения мутации (начальная последовательность - конечная последовательность), во втором - позиция, на которой произошла мутация, в третьем - описана произошедшая мутация.
Комментарии к выравниваниям, построенным программой
Время возникновения Позиция возникновения Мутация
р5 - р6 2 Вставка а.к.о. W (Триптофан)
р2 - р3 4 Замена а.к.о. R (Аргинин) на а.к.о. S (Серин)
р2 - р3 5 Вставка а.к.о. R (Аргинин)
р2 - р3 6 Вставка а.к.о. G (Глицин)
р2 - р3 7 Вставка а.к.о. А (Аланин)
р4 - р5 8 Вставка а.к.о. v (Валин)
р0 - р1 9 Вставка а.к.о. А (Аланин)
р0 - р1 9 Замена а.к.о. А (Аланин) на а.к.о. V (Валин)
р1 - р2 10 Вставка а.к.о. V (Валин)
р0 - р1 11 Замена а.к.о. А (Аланин) на а.к.о. V (Валин)

Автоматически построенное выравнивание было впоследствии исправленно мной вручную. Результат исправлений представлен на рис.5.
Рис.5 Отредактированное вручную выравнивание
Ссылка на fasta-файл.



Для придания выравниванию эволюционно-верного и понятного вида мной было выполненно несколько перестановок гэпов и а.к.о. Например, а.к.о R, стоящий в первых трех последовательностях на четвертой позиции, был перемещен на пятую (логично предположить, что вместо замены R на S на четвертой позиции, а затем вставки R на пятой, произошла вставка S на четвертой); а.к.о Т и N с 21 и 22 позиций первых трех последовательностей были перемещены на 20 и 21, в то время как гэп с 20 позиции был отправлен на 22 (данные изменения были произведены для сохранения семи мутаций при смене поколения); на 34 позицию последовательностей с третьей по восьмую был добавлен гэп (причина аналогична предыдущему описанному изменению) и т.д. Все изменения вы можете отследить, сравнивая последовательности с рис.4 и рис.5.
Определять возникшие мутации я решила по уже отредактированному вручную выравниванию. Всего было насчитано 47 мутации. Из них: 7 замен, 5 делеций и 35 вставок. Некоторые мутации подробно описаны с помощью таблицы "Комментарии к выравниваниям, сделанным вручную". В первом столбце которой указан момент возникновения мутации (начальная последовательность - конечная последовательность), во втором - позиция, на которой произошла мутация, в третьем - описана произошедшая мутация.
Комментарии к выравниваниям, сделанным вручную
Время возникновения Позиция возникновения Мутация
р0 - р1 94 Вставка а.к.о. Т (Треонин)
р1 - р2 58 Делеция а.к.о. К (Лизин)
р2 - р3 87 Замена а.к.о. А (Аланин) на а.к.о. F (Фенилаланин)
р3 - р4 48 Вставка а.к.о. R (Аргинин)
р4 - р5 68 Делеция а.к.о. G (Глицин)
р5 - р6 59 Замена а.к.о. S (Серин) на а.к.о. N (Аспарагин)
р6 - р7 28 Вставка а.к.о. F (Фенилаланин)
На самом деле, для каждого поколения должно было происходить семь мутаций (по условиям, заданным программой). А значит, в конечном итоге я должна получить 49 мутаций. Но по результатам ручной обработки мной было насчитано всего 47, как уже говорилось выше.(Во всех раундах мутаций, кроме самого первого, происходит по семь изменений, однако при переходе от р0 к р1 их всего пять) Значит, были допущенны ошибки, наличие которых не позволяет нам однозначно судить о достоверности результатов проведенного исследования.

Ссылка на Bash скрипт

Смысл написанного мной скрипта заключается в многократном повторении одинаковых команд, использующих различные файлы. Я понимаю, что применение циклов или масок может существенно облегчить и упростить скрипт, однако природная мнительность и многократные попытки создать этот упрощенный вариант привели меня к результату, который вы можете увидеть здесь.

© Serebrennikova Maria 2017